Unicode Normalize

パス整合だけで見ていたら、google-drive-ocamlfuseみたいな中間ツールを挟んだときにある程度勝手に正規化され、手元の元データとのズレが発生したりする。

code:python

import unicodedata

unicodedata.normalize("NFKC")

code:js

"あばばばば".normalize("NFKC")

NFC

NFKC

NFD

NFKD

覚えられないし、特徴もわかりかねている…